# Packages
library(tidyverse)

# Setup
load('data/data.RData')

data %>%
  mutate(
    SO = case_when(
      SO == "Austral: Brazilian Journal of Strategy and International Relations" ~ "Austral",
      SO == "Brazilian Journal of International Relations" ~ "BJIR",
      SO == "Conjuntura Austral: Journal of the Global South" ~ "Conjuntura Austral",
      SO == "Estudos Internacionais: Revista de Relações Internacionais da PUC Minas" ~"Estudos Internacionais",
      SO == "Meridiano 47 - Journal of Global Studies" ~ "Meridiano 47",
      SO == "Monções: Revista de Relações Internacionais da UFGD" ~ "Monções",
      SO == "Oikos - Revista de Economia Politica Internacional" ~ "Oikos",
      SO == "Revista Brasileira de Estudos de Defesa" ~ "RBED",
      SO == "Revista Brasileira de Politica Internacional" ~ "RBPI",
      TRUE ~ SO
      
    )
  ) %>% 
  filter(PY < 2022) -> data


rm_accent <- function(str,pattern="all") {
  if(!is.character(str))
    str <- as.character(str)
  
  pattern <- unique(pattern)
  
  if(any(pattern=="?"))
    pattern[pattern=="?"] <- "?"
  
  symbols <- c(
    acute = "????????????",
    grave = "??????????",
    circunflex = "??????????",
    tilde = "??????",
    umlaut = "???????????",
    cedil = "??"
  )
  
  nudeSymbols <- c(
    acute = "aeiouAEIOUyY",
    grave = "aeiouAEIOU",
    circunflex = "aeiouAEIOU",
    tilde = "aoAOnN",
    umlaut = "aeiouAEIOUy",
    cedil = "cC"
  )
  
  accentTypes <- c("?","`","^","~","?","?")
  
  if(any(c("all","al","a","todos","t","to","tod","todo")%in%pattern)) # opcao retirar todos
    return(chartr(paste(symbols, collapse=""), paste(nudeSymbols, collapse=""), str))
  
  for(i in which(accentTypes%in%pattern))
    str <- chartr(symbols[i],nudeSymbols[i], str)
  
  return(str)
}

data %>%   
  separate_rows(AU,sep = ";") %>% 
  mutate(
    AU = str_trim(AU) %>% str_to_lower(.) %>% rm_accent(.),
    AU = case_when(
      AU == 'alexandre fuccille' ~  'luis alexandre fuccille',
      AU == 'paulo roberto almeida' ~ 'paulo roberto de almeida',
      AU == 'cristina pecequilo' ~ 'cristina soreanu pecequilo',
      AU == 'cristina s pecequilo' ~ 'cristina soreanu pecequilo',
      AU == 'andre reis da silva' ~ 'andre luiz reis da silva',
      AU == 'andre l. reis da silva' ~ 'andre luiz reis da silva',
      AU == 'andre luis reis da silva' ~ 'andre luiz reis da silva',
      AU == 'marcelo de a. medeiros' ~ 'marcelo de almeida medeiros',
      AU == 'marco cepik' ~ 'marco aurelio chaves cepik',
      AU == 'dawisson lopes' ~ 'dawisson belem lopes',
      AU == 'leonardo ramos' ~ 'leonardo cesar souza ramos',
      AU == 'paulo visentini' ~ 'paulo fagundes visentini',
      AU == 'paulo g. fagundes visentini' ~ 'paulo fagundes visentini',
      AU == 'alexsandro  pereira' ~ 'alexsandro eugenio pereira',
      AU == 'lucas rezende' ~ 'lucas pereira rezende',
      AU == 'lucas p. rezende' ~ 'lucas pereira rezende',
      AU == 'lucas  rezende' ~ 'lucas pereira rezende',
      AU == 'luiz a. p. souto maior' ~ 'luiz augusto souto maior',
      AU == 'luiz augusto souza maior' ~ 'luiz augusto souto maior',
      AU == 'marcelo fernandes' ~ 'marcelo fernandes de oliveira',
      AU == 'marcelo fernandes oliveira' ~ 'marcelo fernandes de oliveira',
      AU == 'bruna jaeger coelho' ~ 'bruna coelho jaeger',
      AU == 'carlos eduardo carvalho' ~ 'carlos eduardo ferreira de carvalho',
      AU == 'carlos frederico dominguez avila' ~ 'carlos federico dominguez avila',
      AU == 'cristina inoue' ~ 'cristina yumie aoki inoue',
      AU == 'cristina y.a. inoue' ~ 'cristina yumie aoki inoue',
      AU == 'eduardo  viola' ~ 'eduardo viola',
      AU == 'marcos antonio silva' ~ 'marcos antonio da silva',
      AU == 'maria del pilar ostos' ~ 'maria del pilar ostos cetina',
      AU == 'rafael duarte villa' ~ 'rafael antonio duarte villa',
      AU == 'alana camoca goncalves oliveira' ~ '',
      AU == 'alana camoca' ~ 'alana camoca goncalves de oliveira',
      AU == 'fernanda cristina ribeiro rodrigues' ~ 'fernanda cristina nanci izidro goncalves',
      AU == 'haroldo ramanzini' ~ 'haroldo ramanzini junior',
      AU == 'thiago gehre' ~ 'thiago gehre galvao',
      AU == 'virgilio arraes' ~ 'virgilio caixeta arraes',
      AU == 'analucia pereira' ~ 'analucia danilevicz pereira',
      AU == 'corival carmo' ~ 'corival alves do carmo',
      AU == 'giorgio schutte' ~ 'giorgio romano schutte',
      AU == 'giorgio romano' ~ 'giorgio romano schutte',
      AU == 'graciela conti pagliari' ~ 'graciela de conti pagliari',
      AU == 'graciela di conti pagliari' ~ 'graciela de conti pagliari',
      AU == 'henrique zeferino menezes' ~ 'henrique zeferino de menezes',
      AU == 'javier vadell' ~ 'javier alberto vadell',
      AU == 'marcos alan shaikhzadeh v. ferreira' ~ 'marcos alan s. v. ferreira',
      AU == 'marcos alan shaikhzadeh vahdat ferreira' ~ 'marcos alan s. v. ferreira',
      AU == 'mauricio santoro' ~ 'mauricio santoro rocha',
      AU == 'anna c. carletti' ~ 'anna carletti',
      AU == 'david morales martinez' ~ 'elias david morales martinez',
      AU == 'henrique altemani oliveira' ~ 'henrique altemani de oliveira',
      AU == 'marcos aurelio guedes' ~ 'marcos aurelio guedes de oliveira',
      AU == 'joao victor guedes-neto' ~ 'joao victor guedes neto',
      AU == 'marcos aurelio guedes' ~ 'marcos aurelio guedes de oliveira',
      AU == 'marcos valle machado silva' ~ 'marcos valle machado da silva',
      AU == 'ana saggioro' ~ 'ana elisa saggioro garcia',
      AU == 'ana saggioro garcia' ~ 'ana elisa saggioro garcia',
      AU == 'aureo toledo' ~ 'aureo de toledo gomes',
      AU == 'aureo gomes' ~ 'aureo de toledo gomes',
      AU == 'bruno ayllon pino' ~ 'bruno ayllon',
      AU == 'bruno ayllon pinto' ~ 'bruno ayllon',
      AU == 'carolina moulin' ~ 'carolina moulin aguiar',
      AU == 'celso amorim' ~ 'celso luiz nunes amorim',
      AU == 'camille amorim' ~ 'camille amorim leite ribeiro',
      AU == 'domicio proenca' ~ 'domicio proenca junior',
      AU == 'erico duarte' ~ 'erico esteves duarte',
      AU == 'erico e. duarte' ~ 'erico esteves duarte',
      AU == 'frederico almeida castro marinho' ~ 'frederico de almeida castro marinho',
      AU == 'eugenio v. garcia' ~ 'eugenio vargas garcia',
      AU == 'eugenio diniz' ~ 'eugenio pacelli lazzarotti diniz costa',
      AU == 'fabricio h. chagas bastos' ~ 'fabricio henricco chagas bastos',
      AU == 'fabricio pereira' ~ 'fabricio padilha pereira da silva',
      AU == 'fabricio pereira da silva' ~ 'fabricio padilha pereira da silva',
      AU == 'flavio pietrobon costa' ~ 'flavio pietrobon-costa',
      AU == 'joao estevam' ~ 'joao estevam dos santos filho',
      AU == 'joao arthur reis' ~ 'joao arthur da silva reis',
      AU == 'joao henrique roriz' ~ 'joao henrique ribeiro roriz',
      AU == 'joao marcelo cornetet' ~ 'joao marcelo conte cornetet',
      AU == 'joao miguel villas-boas barcellos villas-boas barcellos' ~ 'joao miguel barcellos',
      AU == 'joao moura e. m. da fonseca' ~ 'joao moura fonseca',
      AU == 'joao paulo s. alsina' ~ 'joao paulo soares alsina jr',
      AU == 'joao paulo soares alsina jr.' ~ 'joao paulo soares alsina jr',
      AU == 'edson jose neves jr.' ~ 'edson jose neves junior',
      AU == 'jose o. perez' ~ 'jose oviedo perez',
      AU == 'klei p. medeiros' ~ 'klei medeiros',
      AU == 'lara selis' ~ 'lara martim rodrigues selis',
      AU == 'leandro teixeira santos' ~ 'leandro teixeira dos santos',
      AU == 'francisco j. b. s. leandro' ~ 'francisco jose leandro',
      AU == 'leandro teixeira santos' ~ 'leandro teixeira dos santos',
      AU == 'carlos r. s. milani' ~ 'carlos sanchez milani',
      AU == 'luiz rogerio goldoni' ~ 'luiz rogerio franco goldoni',
      AU == 'luiz m. niemeyer' ~ 'luiz m niemeyer',
      AU == 'karina pasquariello mariano' ~ 'karina lilia pasquariello mariano',
      AU == 'maria izabel v. de carvalho' ~ 'maria izabel valladao de carvalho',
      AU == 'karina l. p. mariano' ~ 'karina lilia pasquariello mariano',
      AU == 'karina mariano' ~ 'karina lilia pasquariello mariano',
      AU == 'maria antonella cabral' ~ 'maria antonella cabral lopez',
      AU == 'maria clotilde ribeiro' ~ 'maria clotilde meirelles ribeiro',
      AU == 'maria del carmen villarreal' ~ 'maria del carmen villarreal villamar',
      AU == 'maria do ceu pinto' ~ 'maria do ceu de pinho ferreira pinto',
      AU == 'mariana p. o. de lyra' ~ 'mariana preta oliveira de lyra',
      AU == 'marina vitelli' ~ 'marina gisela vitelli',
      AU == 'marina bernardes' ~ 'marina nunes bernardes',
      AU == 'marinana andrade barros' ~ 'marinana andrade e barros',
      AU == 'rafael almeida ferreira abrao' ~ 'rafael almeira ferreira abrao',
      AU == 'rafael dominguez' ~ 'rafael dominguez martin',
      AU == 'rafael t. schleicher' ~ 'rafael tavares schleicher',
      AU == 'renato t. borges' ~ 'renato thomaz borges',
      AU == 'renato zerbini' ~ 'renato zerbini ribeiro leao',
      AU == 'roberto georg uebel' ~ 'roberto rodolfo georg uebel',
      AU == 'silvia ferabolli' ~ 'silvia regina ferabolli',
      AU == 'thiago malafaia' ~ 'thiago correa malafaia',
      AU == 'ivan thiago machado oliveira' ~ 'ivan thiago machado de oliveira',
      AU == 'vinicius santiago' ~ 'virginia santiago dos santos goes',
      AU == 'tiago tasca' ~ 'tiago gabriel tasca',
      AU == 'ana flavia barros platiau' ~ 'ana flavia barros-platiau',
      AU == 'ana flavia granja' ~ 'ana flavia barros-platiau',
      AU == 'ana flavia granja barros-platiau' ~ 'ana flavia barros-platiau',
      AU == 'ana flavia granja e barros' ~ 'ana flavia barros-platiau',
      AU == 'ana flavia granja e barros platiau' ~ 'ana flavia barros-platiau',
      AU == 'ana flavia platiau' ~ 'ana flavia barros-platiau',
      AU == 'ana paula tostes' ~ 'ana paula balthazar tostes',
      AU == 'ana paula b. tostes' ~ 'ana paula balthazar tostes',
      AU == 'andrea pacheco pacifico' ~ 'andrea maria calazans pacheco pacifico',
      AU == 'angelica szucko' ~ 'angelica saraiva szucko',
      AU == "augusto c. dall?agnol" ~ "augusto cesar dall'agnol",
      AU == 'augusto w. m. teixeira' ~ 'augusto wagner menezes teixeira junior',
      AU == 'pedro henrique neves' ~ 'pedro henrique neves de carvalho',
      AU == 'ana beatriz araujo' ~ 'ana beatriz arantes araujo',
      AU == 'beatriz marcondes azevedo' ~ 'beatriz marcondes de azevedo',
      AU == 'bernardo wahl g. de araujo jorge' ~ 'bernardo wahl goncalves de araujo jorge',
      AU == 'clarissa dri' ~ 'clarissa franzoi dri',
      AU == 'claudia marconi' ~ 'claudia alvarenga marconi',
      AU == 'cristiano mendes' ~ 'cristiano garcia mendes',
      AU == 'ademar pozzatti' ~ 'ademar pozzatti junior',
      AU == 'agnaldo dos santos santos' ~ 'agnaldo santos',
      AU == 'alberto montoya palacios jr.' ~ 'alberto montoya correa palacios',
      AU == 'alena vysotskaya g. vieira' ~ 'alena vysotskaya guedes vieira',
      AU == 'alex abi dal gobbo' ~ 'alex dal gobbo abi',
      AU == 'alexander arciniegas' ~ 'alexander arciniegas carreno',
      AU == 'alexandre freitas' ~ 'alexandre jeronimo de freitas',
      AU == 'alexandre jeronimo freitas' ~ 'alexandre jeronimo de freitas',
      AU == 'alexsandro pereira' ~ 'alexsandro eugenio pereira',
      AU == 'amado cervo' ~ 'amado luiz cervo',
      AU == 'amancio jorge de oliveira' ~ 'amancio jorge nunes silva de oliveira',
      AU == 'amancio jorge nunes de oliveira' ~ 'amancio jorge nunes silva de oliveira',
      AU == 'ana carolina delgado' ~ 'ana carolina teixeira delgado',
      AU == 'ana cristina alves' ~ 'ana cristina araujo alves',
      AU == 'ana garcia' ~ 'ana elisa saggioro garcia',
      AU == 'ana maura tomesani' ~ 'ana maura tomesani marques',
      AU == 'ana rachel fortes' ~ 'ana rachel simoes fortes',
      AU == 'ana tereza lopes marra de sousa' ~ 'ana tereza lopes marra de souza',
      AU == 'andre francisco matsuno frota' ~ 'andre francisco matsuno da frota',
      AU == 'andrea freire lucena' ~ 'andrea freire de lucena',
      AU == 'andrea q steiner' ~ 'andrea quirino steiner',
      AU == 'andres del rio' ~ 'andres del rio roldan',
      AU == 'andres ferrari haines' ~ 'andres ernesto ferrari haines',
      AU == 'angelica szucko' ~ 'angelica saraiva szucko',
      AU == 'anselmo oliveira rodrigues' ~ 'anselmo de oliveira rodrigues',
      AU == 'antonio henrique lucena silva' ~ 'antonio henrique lucena da silva',
      AU == 'antonio ruy almeida silva' ~ 'antonio ruy de almeida silva',
      AU == 'argemiro procopio' ~ 'argemiro procopio filho',
      AU == 'arlene b. tickner' ~ 'arlene beth tickner',
      AU == 'arthur coelho dornelles jr.' ~ 'arthur coelho dornelles junior',
      AU == 'arthur mastroiani lucena' ~ 'arthur mastroiani maximo de lucena',
      AU == 'athos munhoz da silva' ~ 'athos munhoz moreira da silva',
      AU == 'barbara lopes' ~ 'barbara lopes campos',
      AU == 'barros-platiau' ~ 'ana flavia barros-platiau',
      AU == 'bruna ferreira' ~ 'bruna ferreira pinheiro',
      AU == 'bruno mendelski' ~ 'bruno mendelski de souza',
      AU == "camila de' carli" ~ 'camila de carli cardoso de oliveira',
      AU == 'carina costa oliveira' ~ 'carina costa de oliveira',
      AU == 'carla morasso' ~ 'carla maria morasso',
      AU == 'carmen licia palazzo-almeida' ~ 'carmen licia palazzo de almeida',
      AU == 'caue pimentel' ~ 'caue rodrigues pimentel',
      AU == 'daniel campos carvalho' ~ 'daniel campos de carvalho',
      AU == 'daniel daniel de pinho barreiros' ~ 'daniel de pinho barreiros',
      AU == 'daniel morales' ~ 'daniel morales ruvalcaba',
      AU == 'danielly ramos becard' ~ 'danielly silva ramos becard',
      AU == 'danielly ramos bercard' ~ 'danielly silva ramos becard',
      AU == 'danilo marcondes de souza' ~ 'danilo marcondes de souza neto',
      AU == 'danilo marcondes' ~ 'danilo marcondes de souza neto',
      AU == 'david p. succi junior' ~ 'david paulo succi junior',
      AU == 'david succi junior' ~ 'david paulo succi junior',
      AU == 'deisy ventura' ~ 'deisy de freitas lima ventura',
      AU == 'deywisson ronaldo de souza' ~ 'deywisson ronaldo oliveira de souza',
      AU == "diego trindade d'avila magalhaes" ~ 'diego trindade d?avila magalhaes',
      AU == 'douglas castro' ~ 'douglas de castro',
      AU == 'douglas h. novelli' ~ 'douglas henrique novelli',
      AU == 'douglas novelli' ~ 'douglas henrique novelli',
      AU == 'edson j. neves jr.' ~ 'edson jose neves junior',
      AU == 'elias martinez' ~ 'elias david morales martinez',
      AU == 'eloi senhoras' ~ 'eloi martins senhoras',
      AU == 'emerson maione' ~ 'emerson maione de souza',
      AU == 'emilse calderon' ~ 'emilse eliana calderon',
      AU == 'enzo lenine' ~ 'enzo lenine lima',
      AU == 'erica simone resende' ~ 'erica simone almeida resende',
      AU == 'erik ribeiro' ~ 'erik herejk ribeiro',
      AU == 'ernani torres' ~ 'ernani teixeira torres filho',
      AU == 'estevao c. de rezende martins' ~ 'estevao de rezende martins',
      AU == 'evelise zampier silva' ~ 'evelise zampier da silva',
      AU == 'fabiano mielniczuk' ~ 'fabiano pellin mielniczuk',
      AU == 'fabio albergaria queiroz' ~ 'fabio albergaria de queiroz',
      AU == 'felipe leal albuquerque' ~ 'felipe leal ribeiro de albuquerque',
      AU == 'felipe loureiro' ~ 'felipe pereira loureiro',
      AU == 'filipe de figueiredo' ~ 'filipe de figueiredo dos santos reis',
      AU == 'flavia campos mello' ~ 'flavia de campos mello',
      AU == 'flavia loss araujo' ~ 'flavia loss de araujo',
      AU == 'francisco p. garcia' ~ 'francisco proenca garcia',
      AU == 'frank r. pfetsch' ~ 'frank richard pfetsch',
      AU == 'george bronzeado andrade' ~ 'george bronzeado de andrade',
      AU == 'george bronzado de andrade' ~ 'george bronzeado de andrade',
      AU == 'geovana zoccal' ~ 'geovana zoccal gomes',
      AU == 'geraldine duarte' ~ 'geraldine marcelle moreira braga rosas duarte',
      AU == 'geraldine rosas duarte' ~ 'geraldine marcelle moreira braga rosas duarte',
      AU == 'gilberto m. a. rodrigues' ~ 'gilberto marcos antonio rodrigues',
      AU == 'gills vilar-lopes' ~ 'gills vilar lopes',
      AU == 'graciela de conti pagliai' ~ 'graciela de conti pagliari',
      AU == 'graciela zubelzu' ~ 'graciela zubelzu de bacigalupo',
      AU == 'guilherme casaroes' ~ 'guilherme stolle paixao e casaroes',
      AU == 'guilherme di lorenzo' ~ 'guilherme di lorenzo pires',
      AU == 'guilherme frizzera' ~ 'guilherme frizzera loyola',
      AU == 'guillermo johnson' ~ 'guillermo alfredo johnson',
      AU == 'helena salim castro' ~ 'helena salim de castro',
      AU == 'heloisa c. machado da silva' ~ 'heloisa conceicao machado da silva',
      AU == 'henrique menezes' ~ 'henrique zeferino de menezes',
      AU == 'henry iure paiva silva' ~ 'henry iure de paiva silva',
      AU == 'iara leite' ~ 'iara costa leite',
      AU == 'igor h. sabino de farias' ~ 'igor henriques sabino de farias',
      AU == 'isabela nogueira' ~ 'isabela nogueira de morais',
      AU == 'isaias albertin moraes' ~ 'isaias albertin de moraes',
      AU == 'israel barnabe' ~ 'israel roberto barnabe',
      AU == 'ivan tiago machado oliveira' ~ 'ivan thiago machado de oliveira',
      AU == 'jacqueline a. h haffner' ~ 'jacqueline a. haffner',
      AU == 'jacqueline a haffner' ~ 'jacqueline a. haffner',
      AU == 'jaime preciado' ~ 'jaime preciado coronado',
      AU == 'jean lima' ~ 'jean santos lima',
      AU == 'jeane silva freitas' ~ 'jeane silva de freitas',
      AU == 'jessica da silva c de oliveira' ~ 'jessica da silva correia de oliveira',
      AU == 'jessica tauane santos' ~ 'jessica tauane dos santos',
      AU == 'joao roberto martins' ~ 'joao roberto martins filho',
      AU == 'joelton carneiro lima' ~ 'joelton carneiro de lima',
      AU == 'jose-augusto guilhon-albuquerque' ~ 'jose augusto guilhon albuquerque',
      AU == 'jose briceno-ruiz' ~ 'jose briceno ruiz',
      AU == 'jose kessio lemos' ~ 'jose kessio floro lemos',
      AU == 'jose luis fiori' ~ 'jose luis da costa fiori',
      AU == 'jose marangoni camargo marangoni camargo' ~ 'jose marangoni camargo',
      AU == 'jose miguel martins' ~ 'jose miguel quedi martins',
      AU == 'juliana de paula bigatao' ~ 'juliana bigatao puig',
      AU == 'kai kenkel' ~ 'kai michael kenkel',
      AU == 'kamilla rizzi' ~ 'kamilla raquel rizzi',
      AU == 'kathryn hochstetler' ~ 'kathryn ann hochstetler',
      AU == 'katiuscia moreno galhera' ~ 'katiuscia moreno galhera esposito',
      AU == 'katiuscia moreno esposito' ~ 'katiuscia moreno galhera esposito',
      AU == 'katiuscia m. g. esposito' ~ 'katiuscia moreno galhera esposito',
      AU == 'larlecianne piccolli' ~ 'larleciane piccolli',
      AU == 'laura c. ferreira-pereira' ~ 'laura cristina ferreira-pereira',
      AU == 'leonardo c. a. santa rita' ~ 'leonardo coelho assuncao santa rita',
      AU == 'leonardo valente' ~ 'leonardo valente monteiro',
      AU == 'leticia carvalho de souza' ~ 'leticia carvalho de souza andrade',
      AU == 'leticia carvalho' ~ 'leticia carvalho de souza andrade',
      AU == 'lia cecilia valls pereira' ~ 'lia cecilia baker fonseca valls pereira',
      AU == 'lia valls pereira' ~ 'lia cecilia baker fonseca valls pereira',
      AU == 'lincoln bizzozero' ~ 'lincoln bizzozero revelez',
      AU == 'luan nascimento silva' ~ 'luan do nascimento silva',
      AU == 'lucas g. freire' ~ 'lucas grassi freire',
      AU == 'lucas kerr oliveira' ~ 'lucas kerr de oliveira',
      AU == 'luciana brandao' ~ 'luciana costa brandao',
      AU == 'luciana r. campos' ~ 'luciana rezende campos oliveira',
      AU == 'ludmila culpi' ~ 'ludmila a. culpi',
      AU == 'luis l. schenoni' ~ 'luis leandro schenoni',
      AU == 'luis schenoni' ~ 'luis leandro schenoni',
      AU == 'luiz henrique dias silva' ~ 'luiz henrique dias da silva',
      AU == 'florencia rubiolo' ~ 'maria florencia rubiolo',
      AU == 'm. florencia rubiolo' ~ 'maria florencia rubiolo',
      AU == 'manoela miklos' ~ 'manoela salem miklos',
      AU == 'manuela picq' ~ 'manuela lavinas picq',
      AU == 'marcelle bessa' ~ 'marcelle christine bessa',
      AU == 'marcelo m. valenca' ~ 'marcelo mello valenca',
      AU == 'marcelo valenca' ~ 'marcelo mello valenca',
      AU == 'marcial a. g. suarez' ~ 'marcial a. garcia suarez',
      AU == 'maria izabel v de carvalho' ~ 'maria izabel valladao de carvalho',
      AU == 'mariana balau' ~ 'mariana balau silveira',
      AU == 'mariana castro' ~ 'mariana castro de carvalho',
      AU == 'mariana cockles' ~ 'mariana cockles teixeira',
      AU == 'marilia carolina b. souza' ~ 'marilia carolina barbosa de souza pimenta',
      AU == 'marrielle maia' ~ 'marrielle maia alves ferreira',
      AU == 'marta fernandez' ~ 'marta fernandez moreno',
      AU == 'matias daniel ferreyra' ~ 'matias daniel avelino ferreyra wachholtz',
      AU == 'natali hoff' ~ 'natali laise zamboni hoff',
      AU == 'natalia nahas calfat' ~ 'natalia nahas carneiro maia calfat',
      AU == 'nicolas comini' ~ 'nicolas matias comini',
      AU == 'nicole de paula' ~ 'nicole de paula domingos',
      AU == 'niels soendergaard' ~ 'niels s?ndergaard',
      AU == 'nilson araujo souza' ~ 'nilson araujo de souza',
      AU == 'octavio forti' ~ 'octavio forti neto',
      AU == 'oliver p. richmond' ~ 'oliver p richmond',
      AU == 'orion noda' ~ 'orion siufi noda',
      AU == 'patricia fonseca arienti' ~ 'patricia fonseca ferreira arienti',
      AU == 'patricia mara cabral vasconcellos' ~ 'patricia mara cabral de vasconcellos',
      AU == 'paula daniela fernandez' ~ 'paula daniela fernandez hellmund',
      AU == 'paula franco' ~ 'paula franco moreira',
      AU == 'paula sandrin' ~ 'paula orrico sandrin',
      AU == 'paulo afonso brado duarte' ~ 'paulo afonso brardo duarte',
      AU == 'paulo afonso velasco junior' ~ 'paulo afonso monteiro velasco junior',
      AU == 'paulo a. pereira pinto' ~ 'paulo antonio pereira pinto',
      AU == 'paulo fagundes vizentini' ~ 'paulo fagundes visentini',
      AU == 'paulo g. fagundes vizentini' ~ 'paulo fagundes visentini',
      AU == 'pedro erik carneiro' ~ 'pedro erik arruda carneiro',
      AU == 'pedro feliu' ~ 'pedro feliu ribeiro',
      AU == 'pedro fonseca' ~ 'pedro fonseca junior',
      AU == 'pedro txai brancher' ~ 'pedro txai leal brancher',
      AU == 'pedro vinicius pereira brites' ~ 'pedro vinicius pereira brittes',
      AU == 'pedro vinicius brites' ~ 'pedro vinicius pereira brittes',
      AU == 'peter r. demant' ~ 'peter demant',
      AU == 'r. b. j walker' ~ 'r. b. j. walker',
      AU == 'rafael mesquita' ~ 'rafael mesquita de souza lima',
      AU == 'reginaldo nasser' ~ 'reginaldo mattar nasser',
      AU == 'rejane hoeveler' ~ 'rejane carolina hoeveler',
      AU == 'ricardo cesar barbosa' ~ 'ricardo cesar barbosa junior',
      AU == 'ricardo k.s. fermam' ~ 'ricardo k. s. fermam',
      AU == 'ricardo ramalhete' ~ 'ricardo ramalhete moreira',
      AU == 'rodolfo ilario silva' ~ 'rodolfo ilario da silva',
      AU == 'rodrigo curty' ~ 'rodrigo curty pereira',
      AU == 'rodrigo duarte fernandes passos' ~ 'rodrigo duarte fernandes dos passos',
      AU == 'rodrigo teixeira' ~ 'rodrigo correa teixeira',
      AU == 'ruben rodriguez paredes' ~ 'ruben paredes rodriguez',
      AU == 'rubia crisitina wegner' ~ 'rubia cristina wegner',
      AU == 'rubia wegner' ~ 'rubia cristina wegner',
      AU == 'sean burges' ~ 'sean w. burges',
      AU == 'sergio caballero' ~ 'sergio caballero santos',
      AU == 'seyed javad emamjomehzadeh' ~ 'seyyed javad emamjomeh zadeh',
      AU == 'simone kawakami costa' ~ 'simone kawakami goncalves costa',
      AU == 'solange reis' ~ 'solange reis ferreira',
      AU == 'tadeu maciel' ~ 'tadeu morato maciel',
      AU == 'taiane las casas' ~ 'taiane las casas campos',
      AU == 'talita pinotti' ~ 'talita de mello pinotti',
      AU == 'tamiris pereira santos' ~ 'tamiris pereira dos santos',
      AU == 'tatiana berriger' ~ 'tatiana berringer',
      AU == 'tchella maso' ~ 'tchella fernandes maso',
      AU == 'thais de bakker' ~ 'thais de bakker castro',
      AU == 'thais virga' ~ 'thais virga passos',
      AU == 'thalita franciely melo silva' ~ 'thalita franciely de melo silva',
      AU == 'thalita melo silva' ~ 'thalita franciely de melo silva',
      AU == 'thiago borne' ~ 'thiago borne ferreira',
      AU == "timoteo saba m' bunde" ~ "timoteo saba m'bunde",
      AU == 'tom c. dos santos' ~ 'tom claudino dos santos',
      AU == 'traducao: caio gontijo' ~ 'caio gontijo',
      AU == 'valdir silva bezerra' ~ 'valdir da silva bezerra',
      AU == 'vinicius mallmann' ~ 'vinicius henrique mallmann',
      AU == 'vinicius silva santos' ~ 'vinicius silva dos santos',
      AU == 'vinicius tavares oliveira' ~ 'vinicius tavares de oliveira',
      AU == 'vitelio brustolin' ~ 'vitelio marcos brustolin',
      AU == 'vlademir monteiro' ~ 'vlademir monteiro dos santos',
      AU == 'walter antonio desidera' ~ 'walter antonio desidera neto',
      AU == 'william daldegan' ~ 'william daldegan de freitas',
      AU == 'willian moraes roberto' ~ 'willian roberto moraes',
      AU == 'wilson mendonca' ~ 'wilson mendonca junior',
      AU == 'xaman minillo' ~ 'xaman korai minillo',
      AU == 'yasmin renni' ~ 'yasmin sandre renni',
      AU == 'yetzy urimar villarroel' ~ 'yetzy urimar villarroel pena',
      AU == 'pedro matos' ~ 'pedro andrade matos',
      AU == 'gilberto m.a rodrigues' ~ 'gilberto marcos antonio rodrigues',
      AU == 'ticiana amaral' ~ 'ticiana amaral nunes',
      TRUE ~ AU
    )
  ) -> data_AU

data_AU %>%
  distinct() %>%
  group_by(TI, AB) %>%
  distinct() %>%
  count() %>%
  arrange(desc(n)) -> n_authors
n_authors
data %>%
  left_join(.,n_authors) %>%
  rename("n_authors" = n) %>%
  filter(!is.na(n_authors))-> dat_n_authors
dat_n_authors
data %>%
  group_by(SO) %>%
  count() %>%
  rename(
    "n_articles" = n
  ) -> n_artices_per_SO


##########################################################

data_AU %>%
  distinct() %>%
  filter(SO == "Meridiano 47" & PY > 2015) -> dat_au_meridiano


dat_au_meridiano %>%
  distinct() %>%
  group_by(TI, AB) %>%
  distinct() %>%
  count() -> n_authors_med

data %>%
  left_join(.,n_authors_med) %>%
  rename("n_authors" = n) %>%
  filter(!is.na(n_authors))-> dat_n_authors_med

data %>%
  filter(SO == "Meridiano 47" & PY > 2015) %>%
  group_by(SO) %>%
  count() %>%
  rename(
    "n_articles" = n
  ) -> n_artices_per_SO_med

data_AU %>%
  distinct() %>%
  mutate(AU = str_to_title(AU)) %>%
  group_by(AU, SO) %>%
  count() %>%
  ungroup() %>%
  group_by(SO) %>%
  count() %>%
  rename(
    "n_AU" = n
  ) %>%
  left_join(.,n_artices_per_SO) %>%
  mutate(author_diversity = round(n_AU/n_articles, 2)) %>%
  left_join(
    .,
    dat_n_authors %>%
      group_by(SO) %>%
      summarise(co_authorship = mean(n_authors))
  ) %>%
  mutate(SO = if_else(SO == "Meridiano 47","Meridiano 47 (full)",SO)) -> table


################################################################################

dat_au_meridiano %>%
  distinct() %>%
  mutate(AU = str_to_title(AU)) %>%
  group_by(AU, SO) %>%
  count() %>%
  ungroup() %>%
  group_by(SO) %>%
  count() %>%
  rename(
    "n_AU" = n
  ) %>%
  left_join(.,n_artices_per_SO_med) %>%
  mutate(author_diversity = n_AU/n_articles) %>%
  left_join(
    .,
    dat_n_authors_med %>%
      group_by(SO) %>%
      summarise(co_authorship = mean(n_authors))
  ) %>%
  mutate(SO = if_else(SO == "Meridiano 47","Meridiano 47 (2016-2021)",SO)) %>%
  bind_rows(table) %>%
  arrange(desc(author_diversity)) %>%
  select(-n_articles) -> table2
table2 %>% 
  select(n_AU,co_authorship,author_diversity) -> table

